GC-состав
GC-состав (гуанин-цитозиновый состав, ГЦ-состав)[1] — доля гуанина (G) и цитозина (C) среди всех остатков нуклеотидов рассматриваемой нуклеотидной последовательности. GC-состав может быть определён как для фрагмента молекулы ДНК или РНК, так и для всей молекулы или даже всего генома.
Пара GC соединена тремя водородными связями, тогда как пара AT (аденин — тимин) — двумя. Поэтому ДНК с высоким содержанием GC более устойчива к денатурации в растворе, чем ДНК с низким. Кроме водородных связей, на стабильность вторичной структуры ДНК и РНК влияют гидрофобные или стэкинг-взаимодействия между соседними нуклеотидами, не зависящие от последовательности оснований нуклеиновых кислот[2][3].
При проведении ПЦР GC-состав праймера используется для предсказания температуры плавления этого праймера и температуры отжига. Высокий GC-состав праймера позволяет использовать его при высоких температурах отжига.
Вычисление GC-состава
GC-состав обычно представляется в процентном отношении (доля G+C или доля GC) для одной из цепи ДНК или РНК. Процентный GC-состав вычисляется как[4]
- [math]\displaystyle{ GC\%=\cfrac{G+C}{L}\times\ 100 }[/math]
где [math]\displaystyle{ G+C }[/math] — суммарное количество гуанинов и цитозинов, а [math]\displaystyle{ L }[/math] — длина цепи ДНК или РНК в нуклеотидах:
[math]\displaystyle{ L=A+T+G+C }[/math].
[math]\displaystyle{ G+C }[/math] можно также представить в виде вырожденного кода как [math]\displaystyle{ S }[/math], тогда
- [math]\displaystyle{ GC\%=\cfrac{S}{L}\times\ 100 }[/math]
Вычисление смещений в нуклеотидном составе
GC-состав является частным случаем отклонений[прояснить] (англ. skew) в нуклеотидной последовательности тех или иных нуклеотидных оснований или групп оснований.
Например, отклонение по отношению пуринов (суммы всех гуанинов и аденинов) к длине цепи ДНК или РНК в нуклеотидах (доля G+A или доля GA) можно вычислить в процентном отношении [5]:
- [math]\displaystyle{ GA\% =\cfrac{G+A}{L}\times\ 100 }[/math]
где [math]\displaystyle{ G+A }[/math] — суммарное количество гуанинов и аденинов, а [math]\displaystyle{ L }[/math] — длина цепи ДНК или РНК в нуклеотидах:
[math]\displaystyle{ L=A+T+G+C }[/math].
[math]\displaystyle{ G+A }[/math] можно также представить в виде вырожденного кода как [math]\displaystyle{ R }[/math], тогда
- [math]\displaystyle{ GA\%=\cfrac{R}{L}\times\ 100 }[/math]
Аналогично, для пиримидинов (цитозина и тимина):
- [math]\displaystyle{ CT\% =\cfrac{C+T}{L}\times\ 100 =\cfrac{Y}{L}\times\ 100 }[/math]
где [math]\displaystyle{ C+T }[/math] есть сумма всех цитозинов и тиминов, тогда как [math]\displaystyle{ L }[/math] есть длина цепи ДНК или РНК в нуклеотидах.
- Отклонение по отношению суммы всех гуанинов к сумме всех цитозинов или наоборот (сдвиг по отношению суммы всех цитозинов к сумме всех гуанинов):
- Аналогично можно вычислить отклонение по отношению суммы всех аденинов к тиминам или наоборот (суммы всех тиминов к аденинам):
- Вычислить отклонение по отношению суммы всех гуанинов и всех цитозинов, по отношению к сумме всех аденинов и тиминам или наоборот (аденинов и тиминов по отношению к сумме всех гуанинов и цитозинов):
- Вычисление общего отклонения всех пуринов к пиримидинам или наоборот (всех пиримидинов ко всем пуринам), в цепи ДНК:
- Вычислить отклонение по отношению суммы всех цитозинов и всех аденинов, по отношению к сумме всех гуанинов и тиминов или наоборот (гуанинов и тиминов по отношению к сумме всех цитозинов и аденинов):
Примечания
- ↑ Аббревиатура: ГЦ-состав, ЦГ-состав, GC-состав, CG-состав, GC%, ГЦ%
- ↑ Ponnuswamy P., Gromiha M. On the conformational stability of oligonucleotide duplexes and tRNA molecules (англ.) // J Theor Biol : journal. — 1994. — Vol. 169, no. 4. — P. 419—432. — PMID 7526075.
- ↑ Yakovchuk P., Protozanova E., Frank-Kamenetskii M. D. Base-stacking and base-pairing contributions into thermal stability of the DNA double helix (англ.) // Nucleic Acids Res. : journal. — 2006. — Vol. 34, no. 2. — P. 564—574. — doi:10.1093/nar/gkj454. — PMID 16449200. Архивировано 5 марта 2020 года.
- ↑ Madigan, M.T. and Martinko J.M. Brock biology of microorganisms (неопр.). — 10th. — Pearson-Prentice Hall, 2003. — ISBN 84-205-3679-2.
- ↑ Maxim I. Pyatkov and Anton N. Pankratov. SBARS: fast creation of dotplots for DNA sequences on different scales using GA-,GC-content // Bioinformatics : 30. — 2014. — № 12. — С. 1765—1766. — doi:10.1093/bioinformatics/btu095.